Quando temos dois conjuntos de variáveis e queremos estudar a associação entre eles.
Exemplo:
Conjunto X: medidas fisiológicas (pressão, FC, IMC)
Conjunto Y: medidas psicológicas (estresse, ansiedade, depressão)
Objetivo da ACC: O objetivo principal da ACC é encontrar combinações lineares de variáveis de cada conjunto, chamadas variáveis canônicas (\(U\) e \(V\)), de modo que a correlação entre elas seja maximizada. Essas correlações são conhecidas como correlações canônicas.
Fundamentos Teóricos
Suponha o primeiro grupo de variáveis aleatórias no vetor \(\mathbf{x} = [X_1 \hspace{0.2cm} X_2 \hspace{0.2cm} \cdots \hspace{0.2cm} X_p]^t\) de orde \(p \times 1\) e o segundo grupo de variáveis aleatórias no vetor \(\mathbf{y} = [Y_1 \hspace{0.2cm} Y_2 \hspace{0.2cm} \cdots \hspace{0.2cm} Y_q]^t\) de ordem \(q \times 1\), com \(p \leqslant q\).
A principal tarefa da correlação canônica é resumir as associações entre \(\mathbf{x}\) e \(\mathbf{y}\) em termos de poucas covariâncias escolhidas, em vez de usar as \(p \times q\) covariâncias em \(\mathbf{\Sigma}_{xy}\).
O primeiro par de variáveis canônicas é representado pelas variáveis \(U_1 = \mathbf{a}_1^t\mathbf{x}\) e \(V_1 = \mathbf{b}_1^t
\mathbf{y}\), onde os pesos canônicos são “escolhidos” de forma que a correlação entre \(U_1\) e \(V_1\) seja máxima e \(\text{Var}(U_1) =
\text{Var}(V_1) = 1\).
O segundo par de variáveis canônicas é representado pelas variáveis \(U_2 = \mathbf{a}_2^t\mathbf{x}\) e \(V_2 = \mathbf{b}_2^t
\mathbf{y}\), onde os pesos canônicos são “escolhidos” de forma que a correlação entre \(U_2\) e \(V_2\) seja máxima, \(\text{Var}(U_2) =
\text{Var}(V_2) = 1\) e além disso, não seja correlacionado com o primeiro par canônico \((U_1,V_1)\).
Fundamentos Teóricos
De modo geral, o \(k\)-ésimo par de variáveis canônicas é representado pelas variáveis \(U_k = \mathbf{a}_k^t\mathbf{x}\) e \(V_k = \mathbf{b}_k^t \mathbf{y}\), onde os pesos canônicos são “escolhidos” de forma que a correlação entre \(U_k\) e \(V_k\) seja máxima e \(\text{Var}(U_k) = \text{Var}(V_k) = 1\). Além disso, o k-ésimo par canônico não é correlacionado com os demais \(k-1\) pares canônicos.
A correlação entre as variáveis \(U_k\) e \(V_k\) é chamada de correlação canônica, \(k = 1, 2, \cdots, \min(p,q)\).
Fundamentos Teóricos
A análise de correlação canônica visa encontrar combinações lineares \(U=\mathbf{a}^{t}\mathbf{x}\) e \(V=\mathbf{b}^{t}
\mathbf{y}\) de tal forma que
Proposição: Os vetores \(\mathbf{a}_k\) e \(\mathbf{b}_k\) que maximizam a correlação entre os pares canônicos \((U_k,V_k), \,\,\, k = 1, \cdots, \min(p,q)\), são soluções do seguinte sistema de equações:
\(\lambda_k\) é o \(k\)-ésimo maior autovalor da matriz \(\mathbf{\Sigma}_{xx}^{-1}\mathbf{\Sigma}_{xy}\mathbf{\Sigma}_{yx}^{-1}\mathbf{\Sigma}_{yx}\) ou equivalentemente, da matriz \(\mathbf{\Sigma}_{yy}^{-1}\mathbf{\Sigma}_{yx}\mathbf{\Sigma}_{xx}^{-1}\mathbf{\Sigma}_{xy}\).
O vetor \(\mathbf{a}\) é o \(k\)-ésimo autovetor da matriz \(\mathbf{\Sigma}_{xx}^{-1}\mathbf{\Sigma}_{xy}\mathbf{\Sigma}_{yx}^{-1}\mathbf{\Sigma}_{yx}\), associado ao autovalor \(\lambda_k\), normalizado por \(\mathbf{a}\mathbf{\Sigma}_{xx}\mathbf{a}=1\)
O vetor \(\mathbf{b}\) é o \(k\)-ésimo autovetor da matriz \(\mathbf{\Sigma}_{yy}^{-1}\mathbf{\Sigma}_{yx}\mathbf{\Sigma}_{xx}^{-1}\mathbf{\Sigma}_{xy}\), associado ao autovalor \(\lambda_k\), normalizado por \(\mathbf{b}\mathbf{\Sigma}_{yy}\mathbf{b}=1\)
A correlação canônica é a correlação em valor absoluto entre \(U_k\) e \(V_k\) e é igual a \(\sqrt{\lambda_k}\)
ACC para variáveis padronizadas
As variáveis canônicas também podem ser construídas para as variáveis padronizadas, isto é, através das matrizes de correlações das variáveis originais, ou seja, basta resolver:
Dada uma amostra aleatória de tamanho \(n\) dos vetores \(\mathbf{x}\) e \(\mathbf{y}\), as matrizes \(\mathbf{\Sigma}_{xx}\), \(\mathbf{\Sigma}_{yy}\), \(\mathbf{\Sigma}_{xy}\) e \(\mathbf{\Sigma}_{yx}\) são estimadas pelas respectivas matrizes de covariâncias amostrais \(\mathbf{S}_{xx}\), \(\mathbf{S}_{yy}\), \(\mathbf{S}_{xy}\) e \(\mathbf{S}_{yx}\).
No caso da análise de correlações canônicas feita por matrizes de correlações, as matrizes teóricas \(\mathbf{P}_{xx}\), \(\mathbf{P}_{yy}\), \(\mathbf{P}_{xy}\) e \(\mathbf{P}_{yx}\) são estimadas respectivamente pelas matrizes de correlações amostrais \(\mathbf{R}_{xx}\), \(\mathbf{R}_{yy}\), \(\mathbf{R}_{xy}\) e \(\mathbf{R}_{yx}\).
Interpretação das variáveis canônicas
Variáveis canônicas são, em geral, artificiais. Ou melhor, elas não possuem significado físico.
É dada uma interpretação subjetiva para as variáveis canônicas de acordo com a magnitude das correlações das variáveis originais com as variáveis canônicas em foco.
Assim, correlações são medidas para interpretar e analisar a qualidades das variáveis canônicas.
Correlação entre as variáveis canônicas e as variáveis originais
As correlações das variáveis originais com as variáveis canônicas são chamadas de cargas canônicas (canonical loadings) e são dadas por:
Teste para a significância das correlações canônicas
4. Roy’s Largest Root
\[R = \frac{\rho_1^2}{1 - \rho_1^2}\]
Considera apenas o maior componente.
Foca na associação linear dominante.
Comparação entre os Testes
Estatística
Sensível a
Recomendação
Wilks’ Lambda
Vários efeitos
Padrão clássico
Hotelling–Lawley
Efeitos grandes
Útil quando há forte relação
Pillai–Bartlett
Variância explicada
Mais robusta a violações de normalidade
Roy’s Largest Root
1ª dimensão
Útil quando só a 1ª correlação importa
Considerações Teóricas
Todos os testes derivam de distribuições de matrizes (Wishart).
Assumem:
Normalidade multivariada;
Independência entre observações;
Amostras suficientemente grandes.
Para pequenos (n), use bootstrap ou permutação como alternativa robusta.
Exemplo: LifeCycleSavings dataset
Suponha que um economista deseja entender como aspectos econômicos (como renda disponível e taxa de poupança) se relacionam com características demográficas (crescimento populacional e distribuição etária) em diferentes países.
Conjunto X: Indicadores Econômicos:
sr: Taxa de poupança bruta (saving rate), média entre 1960 e 1970.
dpi: Renda pessoal disponível per capita (disposable income).
Conjunto Y: Indicadores Demográficos:
ddpi: Crescimento da renda pessoal disponível per capita (delta dpi).
pop15: Proporção da população com menos de 15 anos.
pop75: Proporção da população com 75 anos ou mais.
Exemplo: LifeCycleSavings dataset
A análise busca identificar padrões multivariados que indiquem como o perfil econômico de um país pode estar associado à sua composição populacional.
Esse tipo de estudo é útil para elaborar políticas públicas que integrem planejamento econômico e social.
# Dados do pacote heplots# X: indicadores de saúde# Y: indicadores socioeconômicosdata("LifeCycleSavings")dados <-na.omit(LifeCycleSavings) %>%scale()dados %>%head()
# Conjunto X: indicadores econômicosX <-as.matrix(dados[, c("sr", "dpi")]) # taxa de poupança e renda disponível# Conjunto Y: demografia e crescimento populacionalY <-as.matrix(dados[, c("ddpi", "pop15", "pop75")])cca <-cca(X, Y)cca
# H_0: as correlações canônicas são nulas.p.asym(cca$corr, N =nrow(X), p =ncol(X), q =ncol(Y), tstat ="Wilks")
Wilks' Lambda, using F-approximation (Rao's F):
stat approx df1 df2 p.value
1 to 2: 0.2410601 15.551222 6 90 3.658629e-12
2 to 2: 0.7539595 7.505617 2 46 1.510096e-03
# Ambos os pares canônicos são estatisticamente significativos. # Isso justifica a interpretação dos dois primeiros componentes canônicos no exemplo apresentado.
A primeira correlação canônica (0,8248) é bastante forte, indicando associação significativa entre os indicadores econômicos (poupança e renda) e os demográficos (crescimento e estrutura etária).
A segunda correlação (0,4960) ainda é moderada e pode conter informações úteis.
Cargas Canônicas (correlação entre variáveis originais e os escores):
Variáveis mais relevantes (X): dpi (\(U_1\)), sr (\(U_2\))
Variáveis mais relevantes (Y): pop15 e pop75 (\(V_1\)), ddpi (\(V_2\)).
Exemplo: LifeCycleSavings dataset
Interpretação:
Países com maior renda disponível tendem a ter menos jovens e mais idosos, o que reflete o impacto econômico da transição demográfica.
Países com menor poupança e maior proporção de jovens tendem a apresentar menor crescimento econômico.
A análise revela padrões estruturais multivariados que podem orientar políticas públicas integradas entre áreas sociais e econômicas.